import csv
import pandas as pd

df=pd.read_excel("E:\pythonProject\数据清洗实训\DATA\北京二手房.xlsx")
dataVals=df.values
# 创建一个列表用来存所有处理好的数据
finalDatas = []
for i in range(len(dataVals)):
    rowDate=[]
    # 获取第一行数据
    row=dataVals[i]
    # row=dataVals[1]
    print(row)
    # ************获取第一列的数据*******
    clo1=str(row[0])
    # print(clo1)
    # 对这一列根据“|”进行划分
    clos=clo1.split("|")
    # print(clos)
    if len(clos)==3:#没有年份的情况
        lcsu=clos[0]
        lc=lcsu[:-4]
        # print(lc)
        # 获取楼层信息
        datetime=""


        hx=lcsu[-4:]
        # print(hx)
        # 获取户型信息


        area=clos[1][:-2]
        p_area="平/米"
        # print(p_area)
        # 获取面积信息

        face_to=clos[2]
        # print(face_to)

    elif len(clos)==5:#有年份的情况
        lc=clos[0]#获取楼层信息
        hx=clos[2]# 获取户型信息
        area = clos[3][:-2]
        p_area = "平/米"# 获取面积信息
        face_to = clos[4]
        datetime=clos[1][:4]# 获取年份信息

    else:print("错误的列长")
    # ***************列1数据分割完毕*********

    #***************** 获取第二行的数据*****************
    loc=row[1]
    # *****************获取第三行数据****************
    comt=row[2]
    # ******************获取第四行数据*****************
    tol_price=row[3]
    # ******************获取第五行数据*****************
    u_of_tol_price=row[4]
    # ******************获取第六行数据*****************
    price_pre_area=row[5][0:-3]
    u_of_price_pre_area=row[5][-3:]


    rowData = []#保存数据
    rowData.append(lc)
    rowData.append(datetime)
    rowData.append("年")
    rowData.append(hx)
    rowData.append(area)
    rowData.append(p_area)
    rowData.append(face_to)
    rowData.append(loc)
    rowData.append(comt)
    rowData.append(tol_price)
    rowData.append(u_of_tol_price)
    rowData.append(price_pre_area)
    rowData.append(u_of_price_pre_area)

    finalDatas.append(rowData)

colTitle=['楼层信息','建房年份','单位（年）','户型信息','面积','面积单位','朝向','房产名称','卖家评论','总价','总价单位','平米单价','单价单位']
with open('../DATA/北京二手房.csv', 'a+', encoding='utf8') as file:
    writer = csv.writer(file)
    writer.writerow(colTitle)
    writer.writerows(finalDatas)

















